Un modèle de langue pour l'estimation de la fraîcheur et la pertinence des documents Web
نویسندگان
چکیده
An effective information retrieval system must satisfy different users search intentions expecting a variety of query categories, comprising recency sensitive queries where fresh content is the major user’s requirement. However, using temporal features of documents to measure their freshness remains a hard task since these features may not be accurately represented in recent documents. In this paper, we propose a language model which estimates the topical relevance and freshness of documents with respect to real-time sensitive queries. In order to improve freshness ranking, our approach models freshness by exploiting terms extracted from recently posted tweets topically relevant to each real-time sensible queries. Our experiments show that there is a clear advantage of using twitter to extract fresh keywords. MOTS-CLÉS : Requêtes sensibles au temps, Modèles de langue, Mots-clés frais.
منابع مشابه
Prise en compte de l'importance d'un site web dans l'estimation de la probabilité a priori de pertinence d'une page web
RÉSUMÉ. Plusieurs caractéristiques ont été utilisées pour estimer la probabilité a priori d’un document comme : la longueur du document, la structure des liens, le facteur temps. Cependant, ces caractéristiques dépendent seulement du document lui même. Or, dans le contexte du web une page web fait partie en général d’un site web. L’idée que nous explorons dans cette article est l’utilisation de...
متن کاملExtraction de la localisation des termes pour le classement des documents
Résumé. Trouver et classer les documents pertinents par rapport à une requête est fondamental dans le domaine de la recherche d’information. Notre étude repose sur la localisation des termes dans les documents. Nous posons l’hypothèse que plus les occurrences des termes d’une requête se retrouvent proches dans un document alors plus ce dernier doit être positionné en tête de la liste de réponse...
متن کاملفایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان
Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...
متن کاملExploitation des signaux sociaux pour estimer la pertinence a priori d'une ressource
RÉSUMÉ 'DQV FHW DUWLFOH QRXV SURSRVRQV XQH DSSURFKH GH UHFKHUFKH G¶LQIRUPDWLRQ 5, TXL prend en compte le contenu social associé à une ressource pour mesurer sa pertinence a priori vis-à-YLV G¶XQH UHTXrWH Nous démontrons comment ces caractéristiques, qui sont sous IRUPH G¶DFWLRQV UHOHYDQW G¶DFWLYLWpV VRFLDOHV VLJQDX[ VRFLDX[ WHOV TXH OH QRPEUH GH M¶DLPH et de "partage", peuvent être combinées po...
متن کاملModèle unifié pour la recherche d'information sémantique
Résumé : Un modèle documentaire permet de définir les unités d’indexation (mots, termes, etc.) et de les relier aux documents dans lesquels elles apparaissent. Il permet également de définir les liens entre documents ou portions de documents (ex. citation). Les modèles documentaires sont généralement exploités en recherche d’information pour la représentation des documents et des requêtes et il...
متن کامل